PowerOPD: Destilación on-policy estable con transformación acotada PowerOPD estabiliza la destilación on-policy con transformación acotada, mejora hasta +6.37% en razonamiento matemático y reduce tiempo un 59%. 2026-06-17 · 1 min